🤔Как принять решение: удалять выбросы или оставлять их
Всё зависит от природы выбросов — являются ли они реальными редкими случаями или ошибками в данных.
🔹 Если выброс отражает действительно существующее, но редкое наблюдение (например, необычно высокая цена на товар, которая действительно была на рынке), то удаление такого значения может привести к модели, игнорирующей важные, хоть и редкие, сценарии.
🔹 Если же выброс возник из-за ошибки ввода, дублирования или другого рода артефакта — его можно удалить без особого риска.
✅Как принять обоснованное решение
Постройте три версии модели: 1. С выбросами. 2. Без выбросов. 3. С обработанными выбросами (например, винзоризацией или логарифмической трансформацией).
Сравните их по кросс-валидации: точности, стабильности, интерпретируемости. Выберите подход, который даёт наилучший баланс между производительностью и объяснимостью.
📌Контекст имеет значение
В медицине, например, выброс может указывать на критическое состояние пациента — и его ни в коем случае нельзя игнорировать. А в пользовательских логах выброс может быть признаком бот-активности.
🤔Как принять решение: удалять выбросы или оставлять их
Всё зависит от природы выбросов — являются ли они реальными редкими случаями или ошибками в данных.
🔹 Если выброс отражает действительно существующее, но редкое наблюдение (например, необычно высокая цена на товар, которая действительно была на рынке), то удаление такого значения может привести к модели, игнорирующей важные, хоть и редкие, сценарии.
🔹 Если же выброс возник из-за ошибки ввода, дублирования или другого рода артефакта — его можно удалить без особого риска.
✅Как принять обоснованное решение
Постройте три версии модели: 1. С выбросами. 2. Без выбросов. 3. С обработанными выбросами (например, винзоризацией или логарифмической трансформацией).
Сравните их по кросс-валидации: точности, стабильности, интерпретируемости. Выберите подход, который даёт наилучший баланс между производительностью и объяснимостью.
📌Контекст имеет значение
В медицине, например, выброс может указывать на критическое состояние пациента — и его ни в коем случае нельзя игнорировать. А в пользовательских логах выброс может быть признаком бот-активности.
In recent times, Telegram has gained a lot of popularity because of the controversy over WhatsApp’s new privacy policy. In January 2021, Telegram was the most downloaded app worldwide and crossed 500 million monthly active users. And with so many active users on the app, people might get messages in bulk from a group or a channel that can be a little irritating. So to get rid of the same, you can mute groups, chats, and channels on Telegram just like WhatsApp. You can mute notifications for one hour, eight hours, or two days, or you can disable notifications forever.
The global forecast for the Asian markets is murky following recent volatility, with crude oil prices providing support in what has been an otherwise tough month. The European markets were down and the U.S. bourses were mixed and flat and the Asian markets figure to split the difference.The TSE finished modestly lower on Friday following losses from the financial shares and property stocks.For the day, the index sank 15.09 points or 0.49 percent to finish at 3,061.35 after trading between 3,057.84 and 3,089.78. Volume was 1.39 billion shares worth 1.30 billion Singapore dollars. There were 285 decliners and 184 gainers.
Библиотека собеса по Data Science | вопросы с собеседований from ms